Fouille de collections de documents en vue d'une caractérisation thématique de connaissances textuelles
نویسندگان
چکیده
Résumé. De nos jours, les entreprises, organismes ou individus se trouvent submergés par la quantité d'information et de documents disponibles. Les utilisateurs ne sont plus capables d’analyser ou d’appréhender ces informations dans leur globalité. Dans ce contexte, il devient indispensable de proposer de nouvelles méthodes pour extraire et caractériser de manière automatique les informations contenues dans les bases documentaires. Nous proposons dans cet article l’approche IC-Doc de caractérisation automatique et thématique du contenu de collections de documents textuels. IC-Doc est basée sur une méthode originale d’extraction et de classification de connaissances textuelles prenant en considération les co-occurrences contextuelles et le partage de contextes entre les différents termes représentatifs du contenu. IC-Doc permet ainsi une extraction automatique de KDMs (Knowledge Dynamic Maps) sur les contenus des bases documentaires. Ces KDMs permettent de guider et d’aider les utilisateurs dans leurs tâches de consultations documentaires. Ce papier présente également une expérimentation de notre approche sur des collections de documents textuels.
منابع مشابه
Un aperçu de la fouille visuelle de données
Résumé. Nous présentons dans cet article un aperçu de la fouille visuelle de données. Pour commencer, nous situons ce domaine par rapport à d’autres approches et nous en rappelons les principes fondateurs. Ensuite, nous montrons qu’il existe de nombreux points de vue pour aborder les travaux en fouille visuelle de données : les données ou connaissances à visualiser, la tâche à accomplir, la rep...
متن کاملUn système de gestion de documents hétérogènes dédiés au patrimoine archéologique et gérés sur le réseau Internet. Le cas de l'épave étrusque du Grand Ribaud
HAL is a multidisciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L'archive ouverte pluridisciplinaire HAL, est destinée au dépôt età la diffusion de documents scientifiques de niveau r...
متن کاملGénération de documents multimédia adaptatifs dans une perspective analytique
RÉSUMÉ. Le volume de documents disponible sur l'Internet rend difficile les tâches de recherche d'informations. Parallèlement, des efforts vers la personnalisation de l'Internet permettent l'adaptation des pages web à l'utilisateur. Pour ce faire, les travaux s'orientent vers les concepts des systèmes d'informations adaptatifs et de la génération de résumés de collections de pages. La plupart d...
متن کاملVers une Cartographie des Connaissances Guidée par la Fouille des Données
Résumé. Ce papier présente une nouvelle approche de cartographie des connaissances stratégique/métiers guidée par apprentissage automatique en vue de définir la stratégie de gestion des connaissances à engager. La démarche que nous avons expérimentée s’appuie sur une nouvelle méthode cellulaire d’extraction de règles à partir des données nommée CASI (Cellular Automaton for Symbolic Induction). ...
متن کاملUne ontologie pour l'acquisition et l'exploitation des connaissances en conception inventive
Résumé. L'acquisition des connaissances en vue de résoudre des problèmes concernant l'évolution des artefacts, comme elle se doit d’être pratiquée en conception inventive, a des caractéristiques spécifiques. Elle nécessite la sélection de certaines des connaissances qui peuvent induire des évolutions, elle amène à reformuler le problème initial afin de construire un modèle abstrait de l'artefac...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2005